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摘 要 : 为 及 时 准确 地 获取 干旱 区 农作物 种 植 信息 ,研究 借助 PIE-Engine Studio 平 台 , 以 新 疆 下 者 
盆地 为 研究 区 ,基于 2022 年 Sentinel-2 影 像 和 1948 个 野外 定位 采样 数据 提取 农作物 生育 期 内 14 种 
植被 指数 ,使 用 See5.0 决 策 树 、 随 机 森林 (Random forest,RF) 和 多 元 回归 (Multiple regression , MR ) 模 
型 优选 特征 参数 ,结合 支持 向 量 机 (Support vector machine,SVM) 算 法 构建 5 种 分 类 模型 和 5 种 样 方 
分 割 方案 进行 农作物 种 植 信 息 提取 ,通过 目 视 解 译 和 混淆 矩阵 对 比分 析 分 类 结果 ,确定 最 佳 分 类 
方案 。 结 果 表 明 :(1) 所 有 分 类 模型 的 总 体 精度 (OA ) 和 Kappa 系数 均 在 92.20% 和 0.9037 以 上 ,说 
明 在 PIE 平 台中 使 用 SVM 算 法 提取 农作物 信息 是 可 行 的 (2) SVM- 有 红 边 的 OA 和 Kappa 系数 均值 
为 93.77% 和 0.9236, 比 SVM- 无 红 这 方法 提高 了 0.96% 和 0.0120。(3) 相 比 于 SVM- 有 红 边 方法 ,植被 
指数 的 引入 提高 了 SVM-RF SVM-MR 和 SVM-See5.0 的 OA 和 Kappa 系数,(4) 5 种 分 类 模型 的 OA 
和 Kappa 系数 均值 的 大 小 关系 为 :SVM-RF>SVM-MR>SVM-See5.0>SVM- 有 红 廊 >SVM- 无 红 廊 ,表明 
红 边 波段 和 植被 指数 的 加 入 显著 提高 了 农作物 识别 的 精度 ,其 中 SVM-RF(8:2) 为 最 佳 分 类 模型 ， 
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OA 和 Kappa 系数 分 别 为 98.72% 和 0.9866。 研 究 结 果 可 为 准确 快速 获取 大 尺度 干旱 区 农作物 信息 


提供 新 的 思路 和 参考 依据 。 


X $ il: 农作物 ; Sentinel-2; 支持 向 量 机 ; PIE-Engine Studio; RAAHE 


文章 编号 : 1000 - 6060(2024)04 - 0672 - 12(0672 ~ 0683) 


农作物 种 植 信息 是 进行 农作物 产业 结构 调整 
和 优化 的 重要 基础 和 前 提 ”。 需 普 贫 地 是 新 疆 重要 
的 特色 农产品 生产 基地 ,为 国家 供应 大 量 粮食 ,但 
粮食 生产 受到 荒漠 化 .土壤 盐 碱 化 及 干旱 缺 水 等 胁 
迫 ,作物 种 植 结构 复杂 生态 环境 脆弱 ”。 因 此 ,及 
时 准确 地 掌握 马 普 盆地 农作物 种 植 信息 对 促进 干 
早 区 农业 可 持续 发 展 和 保障 国家 粮食 安全 具有 重 
要 意义 。 

遥感 技术 因 其 覆盖 面 大 探测 速度 快 及 成 本 低 
的 特点 ,为 及 时 准确 地 获取 大 面积 农作物 种 植 信息 
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提供 了 新 的 技术 手段 ““。 目 前 ,基于 单一 影像 源 提 
取 农作物 种 植 结构 信息 的 方法 操作 简单 ,但 不 易 捕 
捉 作物 种 植 “最 佳 识 别 期 影像”; 基于 多 时 序 影 像 
源 提取 农作物 种 植 信息 的 方法 充分 利用 了 作物 季 
相 节 律 特征 ,成 为 当下 农作物 种 植 信息 提取 的 主流 
方法 ”; 在 提取 农作物 信息 时 ,多 特征 参数 法 更 适用 
于 复杂 的 农作物 种 植 区 ,基于 多 特征 参数 的 统计 模 
型 法 在 一 定 程 度 上 解决 了 混合 像 元 问题 ”; 遥感 影 
像 与 统计 数据 融合 法 可 获得 大 尺度 农作物 结构 种 
植 图 ,但 因 较 低 的 制图 分 辩 率 使 得 产品 区 域 适 宜 性 
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PEPE" 。 在 机 器 学 习 方 法 中 支持 向 量 机 算法 谤 化 
能 力 强 , 且 有 较 好 的 鲁 棒 性 ,在 遥感 信息 提取 上 被 
POZMA, RAEE OER YT SATE OJ FEF 
T FY SVM 算法 及 其 改进 后 的 分 类 需 对 区 域 农 
作物 信息 进行 获取 ,取得 较 好 的 分 类 效果 (分 类 精 
度 均 高 于 90% )。 边 增 淮 等 ESE AIL 
等 研究 指出 ,使 用 机 器 学 习 方法 进行 怕 感 信息 提 
取 时 加 入 光谱 特征 纹理 特征 及 物候 特征 可 以 提高 
农作物 分 类 的 精度 。 随 着 遥感 大 数据 时 代 的 到 来 ， 
和 遥感 云 平台 为 快速 处 理 和 分 析 海 量 遥 感 数据 提供 
了 机 遇 ”。 刘 通 等 ”\ 潘 力 等 ”和 姜 伊 兰 等 ”借助 
GEE 平 台 分 别 对 辽宁 盘锦 市 ,淮河 流域 和 开封 市 杞 
县 的 农作物 种 植 信息 进行 提取 ,人 研究 结果 为 当地 农 
作物 信息 提取 和 监测 提供 了 参考 依据 。 可 是 当下 
GEE 平 台 国 内 用 户 不 便 正常 使 用 , 且 使 用 过 程 和 处 
理 结果 的 下 载 , 受 网 络 条 件 的 影响 很 大 ”。 国 产 遥 
感 云 平台 PIE-Fngine Studio 为 共享 数据 、 算 法 和 计 
算 资源 构建 了 一 个 开放 的 环境 ,以 实现 对 遥感 数据 
的 按 需 访问 和 海量 数据 的 快速 处 理 ” 。 然 而 目前 
使 用 PIE-Engine Studio 云 计算 平台 结合 机 融 学 习 方 
法 应 用 于 干旱 区 农作物 识别 的 研究 还 相对 较 少 ,对 
于 该 平台 在 干旱 区 农作物 识别 的 适用 性 还 待 进一步 
研究 , 且 基 于 该 平台 的 时 间 序 列 Sentinel-2 农 作物 识 
别 的 研究 还 鲜 有 涉及 ,Sentinel-2 数 据 的 高 时 间 分 辨 
率 在 农作物 分 类 识别 中 的 优势 还 需 进 一 步 明确 。 

文章 以 新 疆 看 兽 伟 地 为 研究 区 ,利用 PIE-En- 
gine Studio 平 台 , 基 于 Sentinel-2 时 序数 据 和 野外 定 
位 采样 数据 ,使 用 支持 向 量 机 算法 对 2022 年 需 普 盆 
地 的 农作物 种 植 信息 进行 提取 和 精度 评估 ,以 期 获 
取 最 佳 的 农作物 信息 提取 方案 ,为 干旱 区 农作物 种 
植 信息 的 快速 .精确 提取 提供 新 的 思路 和 参考 
依据 。 


1 材料 与 方法 


1.1 研究 区 概况 

址 着 盆地 位 于 新 疆 巴 音 郭 楞 蒙 古 自治 州 境内 
(85°45'25"~87°26' 11"E, 41°40’ 11”~42°25'46"N ) , 塔 
FAR HBAS ARAM ,面积 约 为 75300 km ,地 势 西北 高 
东南 低 , 地 理 区 域 包 含 看 普 回 族 自治 县 、 和 静 县 .和 
贷 县 、 博 湖 县 及 新 疆 生 产 建设 兵团 部 分 团 场 (图 
1)。 该 地 区 四 季 分 明 ,光照 时 间 充 足 ,昼夜 温差 大 ， 
水 热 资源 丰富 , 属 典 型 的 干旱 区 绿洲 气候 。 农 作物 
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图 例 


图 1 研究 区 地 理 位 置 及 作物 样本 点 分 布 
Fig. 1 Geographical location of the study area and 


distribution of crop sample points 


类 型 有 番茄 RAL FRR ,小麦 甜菜 和 棉花 等 ,种 植 
结构 较为 复杂 ,其 中 研究 区 戌 产 番茄 和 闵 椒 ,是 新 
弓 重 要 的 特色 农产品 生产 基地 。 
1.2 数据 来 源 
1.2.1 Sentinel-2 数 据 集 本 文 使 用 的 Level-2A 级 
Sentinel-2 多 光谱 影像 数据 集 源 自 欧 洲 航 天 局 数据 
中 心 ,该 数据 由 Sentinel-2A 和 Sentinel-2B 组 成 , 具 
有 空间 分 辩 率 高 . 重 访 周 期 短 .光谱 波段 通道 数目 
多 以 及 波段 宽度 罕 等 特点 ”。 为 方便 人 研究 不 同 农 
作物 生育 期 影像 变化 ,研究 在 PIE 平 台中 选择 2022 
年 3 一 11 月 的 遥感 影像 , 云 量 覆盖 百分比 在 10% 以 
下 , 共 9 幅 ( 表 1)。 
1.2.2 样本 数据 研究 团队 于 2022 年 7 月 26 日 至 
2022 年 8 月 4 日 前 往 址 着 盆 地 对 农作物 种 植 情况 进 
行 调 查 ,采用 拍照 和 GPS 定位 的 方式 ,获取 1948 个 
典型 地 物 样 点 ,其 中 农作物 包括 5 种 经 济 作物 ( 甘 
草 .葵花 芦苇、 棉花 和 葡萄 ) 3 种 粮食 作物 (水 稻 、 
小 麦 和 玉米 ) .3 种 蔬菜 (番茄 PRL HSE) ART VE 
物 ( 果 林 )。 在 采样 过 程 中 使 用 GPS 定位 作物 样 点 
的 经 纬度 和 海拔 ,并 且 对 地 物 的 周边 生长 环境 及 洪 
溉 方式 进行 记录 ,方便 观察 不 同 农 作物 的 分 布 特征 
和 生长 环境 。 在 分 类 过 程 中 将 样 点 随机 分 割 成 训 
练 样本 和 检验 样本 ,得 到 5 种 样 点 分 割 方案 , 即 5:5、 
6:4.7:3 .8:2 和 9:1( 表 2)。 
1.3 研究 方法 
13.1 分 类 特征 构建 

(1) Sentinel-2 光谱 波段 

Sentinel-2 数 据 共 有 13 个 波段 ,研究 选择 其 中 
用 于 土地 类 型 检测 . 陆 表 检测 .植被 监测 和 环境 检 


674 FIEWH ro 
#1 研究 区 Sentinel-2 影像 数据 
Tab. 1 Sentinel-2 image data for the study area 

序号 传感器 类 型 及 产品 序号 yee 光谱 波段 空间 分 辩 素 /m 。 云 量 /% 
1 S2_L2A_45TUG_20220304 2022-03-04 B2 \B3,.B4,B5 ,B6.B7,B8 ,B8a,B11 .B12 10,20 <10 
2 S2_L2A_45TUG_20220403 2022-04-03 B2,B3,B4,B5 ,B6.B7,B8,B8a,B11,B12 10,20 <10 
3 S2_L2A_45TUG_20220503 2022-05-03 B2,B3 B4 ,B5 ,B6.B7,B8 ,B8a,B11 B12 10,20 <10 
4 S2_L2A_45TUG_20220605 2022-06-05 B2,B3,B4,B5,B6.B7,B8,B8a,B11,B12 10,20 <10 
5 S2_L2A_45TUG_20220705 2022-07-05 B2,B3,B4,B5,B6.B7,B8,B8a,B11,B12 10,20 <10 
6 S2_L2A_45TUG_20220804 2022-08-04 B2,B3 B4 ,B5,B6.B7.B8,B8a,B11,B12 10,20 <10 
7 S2_L2A_45TUG_20220903 2022-09-03 B2,B3,B4,B5,B6.B7.B8,B8a,B11,B12 10,20 <10 
8 S2_L2A_45TUG_20221003 2022-10-03 B2,B3 B4 ,B5 ,B6.B7.B8 ,B8a,B11,B12 10,20 <10 
9 S2_L2A_45TUG_20221102 2022-11-02 B2,B3,B4,B5,B6.B7,B8,B8a,B11,B12 10,20 <10 

R2 研究 区 地 物 样本 统计 表 
Tab.2 Statistics of feature samples in the study area 
样本 类 别 。 样本 总 数 2 n 13 8:2 9:1 
训练 数 ”检验 数 训练 数 ”检验 数 训练 数 ”检验 数 训练 数 ”检验 数 训练 数 ”检验 数 

番茄 190 95 95 114 76 133 57 152 38 171 19 
甘草 70 35 35 42 28 49 21 56 14 63 7 
葵花 180 90 90 108 72 126 54 144 36 162 18 
PRE 289 145 144 173 116 202 87 231 58 260 29 
FE 120 60 60 72 48 84 36 96 24 108 12 
棉花 125 63 62 75 50 88 37 100 25 113 12 
葡萄 190 95 95 114 76 133 57 152 38 171 19 
果林 70 35 35 42 28 49 21 56 14 63 7 
水 稻 180 90 90 108 72 126 54 144 36 162 18 
ABE 289 145 144 173 116 202 87 231 58 260 29 
小 麦 120 60 60 72 48 84 36 96 24 108 12 
玉 》 125 63 62 75 50 88 37 100 25 113 12 


测 的 波段 , 共 10 个 ,分 别 是 B2、B3、B4、B5、B6、B7、 
B8 .B8a,B11 #1B12™!, 

(2) 植被 指数 构建 

植被 指数 因 其 经 过 比值 处 理 , 可 以 部 分 消除 因 
太阳 高 度 角 .卫星 观测 角 HT ,大气 程 辐射 等 所 带 
来 的 影响 ,被 广泛 用 于 农作物 分 类 与 识别 .长 势 监 
测 与 产量 估算 等 方面 。 研 究 利 用 Sentinel-2 的 波段 
构建 多 种 植被 指数 ( 表 3)。 
1.3.2 特征 参 数 优选 方法 构建 较 多 的 特征 参数 在 
一 定 程 度 上 提高 农作物 识别 精度 ,但 过 多 的 特征 
参数 往往 会 出 现 信息 宛 余 现象 ,影响 分 类 模型 的 效 
率 和 精度 "”"。 研 究 采 用 以 下 特征 参数 优选 方法 : 
(1) See5.0 决 策 树 算法 根据 提供 最 大 信息 增益 的 字 
段 对 样本 数据 进行 分 割 ,并 对 决策 树 的 叶子 进行 裁 


剪 或 合并 以 提高 分 类 精度 ,最 后 确定 每 个 叶子 的 最 
佳 阔 值 ,从 而 得 到 每 个 特征 参数 的 重要 性 得 分 ”。 
(2) 随机 森林 (Random forest, RF) 方 法 通过 对 对 象 
和 变量 进行 采样 来 构建 预测 模型 , 即 生成 多 个 决策 
树 并 依次 对 对 象 进行 分 类 ,最 后 将 每 个 决策 树 的 分 
类 结果 汇总 ,所 有 预测 类 别 的 复数 就 是 随机 森林 预 
测 的 对 象 类 别 ,分 类 精度 得 到 提高 ,同时 也 计算 了 
参与 分 类 的 不 同 特征 的 重要 性 3,(3) 多 元 回归 
(Multiple regression , MR ) 模 型 指 含有 多 个 解释 变量 
的 线性 回归 模型 ,用 于 解释 被 解释 的 变量 与 其 他 多 
个 变量 解释 变量 之 间 的 线性 关系 。 

1.3.3 分 类 方法 与 分 类 方案 文 持 向 量 机 (Support 
vector machines , SVM ) 算 法 是 基于 统计 学 习 的 机 侨 
学 习 方 法 ,该 算法 利用 结构 风险 最 小 化 原理 ,在 确 


表 3 植被 指数 计算 公式 


Tab. 3 Vegetation index calculation formula 


序号 ”植被 指数 计算 公式 
1 NDVI B8 — B4)/(B8 + B4) 
2 NDVLw B5 - B4)/(B5 + B4) 
3 NDVbo B6 - B4)/(B6 + B4) 
4 NDVbs B7 - B4)/(B7 + B4) 
5 GI B3/B4 
6 VIgreen B3 - B4)/(B3 + B4) 
7 GNDVI B8 — B3)/(B8 + B3) 
8 RDVI (B8 - B4)/ JB8 + B4 
9 TVI 0.5[120(B8 - B3) - 200(B4 - B3)] 
My Eyi CBA aE XB2+1) 
11 SRI B8/B4 
12 MSR [(B8/B4) - 1)/[(B8/B4)* + 1] 
13 MCARI [(B8 - B4) - 0.2(B8 - B3)]x(B8/B4) 
14 TCARI 3[(B8 - B4) - 0.2(B8 - B3) x (B8/B4)] 


E : NDVI, NDV Ins , NDVI, NDVI, GI, Vigreen, GNDVI,RDVI, 
TVI, EVI, SRI, MSR MCARI 和 TCARI 分 别 代 表 归 一 化 植被 指数 、 
红 边 705 归 一 化 植被 指数 . 红 边 740 归 一 化 植被 指数 ` 红 边 783 归 一 
化 植被 指数 . 绿 度 指数 .绿色 植被 指数 .绿色 归 一 化 植被 指数 E 
化 差异 植被 指数 .三 角 植 被 指数 .增强 植被 指数 .简单 比率 指数 ME 
正 简单 比率 改良 叶绿素 吸收 反射 率 指数 和 转换 叶绿素 吸收 比 指 
数 ;B2.B3.B4.B5.B6.B7 和 了 B8 分 别 代表 Sentinel-2 影 像 的 蓝光 波 
Be . 绿 光 波段 、 红 光波 段 . 红 边 705 波 段 . 红 边 740 波 段 . 红 边 783 波 
段 和 近 红外 波段 。G 为 增益 因子 ; C, 为 第 一 大 气 修正 系数 ,用 于 校 
正大 气 中 的 气 溶胶 影响 ;C; 为 第 二 大 气 修正 系数 ,用 于 校正 大 气 中 
的 水 汽 影 响 ; 工 为 土壤 调节 因子 ,用 于 校正 土壤 背景 的 影响 。 下 同 。 


nee 


E 


保 误 差 最 小 的 情况 下 ,通过 降低 模型 泛 化 误差 的 上 
限 来 提高 分 类 模型 的 泛 化 能 力 ” ,SVM 算法 的 径 向 
基 核 函数 可 将 训练 样本 映射 到 高 维 空间 ,从 而 便于 
进行 多 特征 参数 的 农作物 分 类 。 本 文 基于 Sentinel- 
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1.3.4 精度 评价 (EA A LA EG HEE OT PS 
结果 进行 精度 评价 ,采用 以 下 评价 指标 评估 模型 的 
精度 ,总 体 精度 (Overall accuracy ,OA ) „Kappa 系数 、 
用 户 精 度 (User”s accuracy ,UA)、 制 图 精度 (Produc- 
er’ s accuracy, PA) 、Fl 分数 (Fl score) 、 错 分 误差 
(Commission error, CE ) 和 漏 分 误差 (Omission error, 
OE)。 计 算 公 式 如 下 : 


ye: 


ii 


OA= =F — x 100% (1) 


n 


NÝ P,- YIP,.XP.) 


i=l i=l (2) 


n 


N=) (P, XxP,) 


i=l 


Kappa = 


P, P. 
UA=5~* 100%, PA=-5*x100% (3) 


_ 2PAXUA 
Fl score = A UA x 100% (4) 
P..-P. 
CE=— x100% (5) 
Ps 
P_-P. 
OE = —5— x 100% (6) 


式 中 :为 类 别 数量 ;为 验证 样本 总 数 ; P,, 为 每 类 
中 正确 分 类 样本 的 数量 ,是 ;行列 上 的 值 ; P,, 为 分 
类 器 将 验证 样本 分 为 某 一 类 别 的 总 数 ; P, 为 某 一 
类 别 验证 样本 总 数 。 


2 结果 与 分 析 


2.1 农作物 植被 指数 时 序 特征 
基于 Sentinel-2 时 序数 据 计 算 植 被 指数 ,得 到 
人 研究 区 农作物 植被 指数 时 序 变 化 曲线 (图 2)。 由 图 


2 时 序数 据 构 建 特征 参数 ,借助 R 语 言 优 选 特征 参 
数 ,最 后 使 用 SVM 算法 构建 5 种 分 类 方案 进行 农 作 
物 信息 提取 ( 表 4)。 


2 可知, 不 同 农 作物 因 各 自生 物 学 差异 在 各 植被 指 
数 中 呈现 不 同 的 曲线 波动 趋势 。 由 图 2a 可 知 ,人 研究 
区 农作物 NDVI 值 总 体 呈 移 上 升 后 下 降 的 变化 趋 


表 4 农作物 分 类 方案 


Tab. 4 Crop classification schemes 


分 类 模型 特征 参数 REE 样本 分 割 方案 
SVM- 无 红 边 。 B2 .B3 .B4..B8 .B8a.B11,.B12 7 5:5 .6:4 .7:3 .8:2.9:1 
SVM- 有 红 边 。 B2.B3.B4.B5.B6.B7.B8.B8a.B11.B12 10 5:5 .6:4 .7:3、 8:2 9:1 
SVM-See5.0  B8.EVI.B5.B6.TVI.B7.TCARI.NDVIs GI. B3 ,B2 , Vigreen B4 NDVho, NDWI, 2 5:5 6:4 .7:3, 8:2,9:1 
RNDVINDVINDVIw MCARI.B11.B8ga SRI 

SVM-RF B8 .NDVIns,B3 .B6.TVI B11 ,B2,B4 .EVI .B7 MCARI .RNDVI,B8a, VIgreen .GI.B5. 20 5:5,6:4\7:3,8:2,9:1 
NDVI ,TCARI.GNDVI.NDWI 

SVM-MR MCARI .NDVI .TCARI .SRI.TVI .VIgreen .NDVIs .MSR .B5 .B4 .B8a EVI 12 5:5 .6:4 ,7:3 .8:2 .9:1 
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主 :图 中 字母 含义 见 表 3 注释。 下 同 。 
图 2 植被 指数 时 序曲 线 


图 


Fig. 2 Time-serie graphs of vegetation index 


势 ,其 中 小 麦 和 甜菜 的 NDVI 值 与 其 他 农作物 差异 
显著 ,容易 区 分 ;引入 红 边 波段 后 ,各 农作物 的 ND- 
VI 值 在 7.8 .9 月 差异 较为 明显 (图 2b~d) ,其 中 小 麦 
的 NDVI 值 在 5 月 达到 峰值 ,与 其 他 农作物 差异 明 
显 ,容易 区 分 ;甜菜 的 NDVI 值 在 10 月 达到 峰值 ,与 


其 他 农作物 相差 较 大 ,容易 区 分 ;与 NDVI 值 相 比 ， 
A; ERE HI NDV Los, NDV bo FU NDV Ls 曲线 分 离 
较 好 ,不 同 农 作物 的 物候 特征 更 直观 .更 清晰 ,这 是 
为 红 边 是 绿色 植被 反射 光谱 在 680~780 nm 之 间 
的 最 大 斜率 点 ,因此 更 能 反映 农作物 的 微小 变化 。 


由 图 2m 可知 ,水 称 的 EVI 曲 线 在 8 月 达到 峰值 ,与 
其 他 农作物 相 比 差异 明显 ;由 图 2n~o 可 知 ,棉花 的 
RNDVI 和 SRI 曲 线 在 7 月 达到 峰值 ,与 其 他 农作物 
相 比 差异 明显 。 除 NDWI( 图 2e) 外 ,其 他 农作物 植 
被 指数 (图 2f~o) 呈 现 先 增加 后 减少 趋势 ,由 于 植被 
旨 数 与 农作物 本 身 的 特性 有 关 , 不 同 农 作物 的 物候 
差异 导致 植被 指数 在 增加 减少 和 峰值 出 现 的 时 间 
等 方面 有 差异 。 
2.2 特征 参数 重要 性 评价 
人 研究 利用 See5.0、RF 和 MR 方法 得 到 特征 参数 
的 重要 性 评价 结果 (图 3)。 由 图 3 可 知 ,3 种 方法 得 
到 的 特征 参数 重要 性 排序 均 不 相同 。See5.0 和 RF 
方法 的 结果 中 Sentinel-2 近 红外 波段 (B8) 的 重要 性 
得 分 最 高 ,说 明 近 红外 波段 对 农作物 分 类 结果 的 贡 
献 最 大 ,对 分 类 精度 影响 颇 深 。 对 比 3 种 重要 性 结 
果 发 现 ,排名 前 10 的 特征 参数 中 均 有 NDVI 或 红 边 
NDVI, 说 明 NDVI 或 者 红 边 NDVI 可 以 很 好 地 反映 
出 不 同 农 作物 的 生长 状态 和 和 覆盖 度 , 对 农作物 分 类 
结果 贡献 较 大 。 因 此 根据 特征 参数 重要 性 评价 结 


(a) See5.0 决 策 树 


一 一 累计 百分比 100 
园田 | 重要 性 得 分 


重要 性 得 分 
a 
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果 选 取 3 个 特征 参数 集 : 

(1) See5.0 算 法 的 特征 重要 性 得 分 和 累计 百 分 
比 ( 图 3a) ,获取 重要 性 得 分 大 于 0 的 特征 参数 ,符合 
条 件 的 有 B8、EVI.、B5 、B6、TVI、B7、TCARI、NDVbo;、 
GI.B3.B2.VIgreen.B4.NDVI .NDWI.RNDVI\ND- 
VINDVIs MCARI.B11、.B8a 和 SRI, 共 22 个 。 

(2) RF 的 特征 参数 重要 性 评价 (图 3b) ,选取 累 
计 百 分 比 大 于 90% 的 特征 参数 ,符合 条 件 的 有 B8、 
NDVILos .B3.B6.TVI.B11.B2.B4.EVI.B7.MCARI.、 
RNDVI, B8a , VIgreen .GI、B5.NDVI .TCARI.GND- 
VI 和 NDWI, 共 20 个 。 

(3) MR 模型 的 特征 参数 重要 性 评价 (图 3c), 选 
取 回 归 系 数 大 于 0 的 特征 参数 ,符合 条 件 的 有 MCA- 
RINDVITCARI SRI, TVI, Vigreen NDVLs、 MSR , 
BS .B4、B8a Fil EVI, dE 12 4, 
2.3 精度 评价 

研究 对 25 种 分 类 结果 进行 精度 验证 与 对 比 , 结 
果 见 图 4:(1) 所 有 农作物 分 类 模型 的 0A 均 大 于 
92.20% , Kappa 系数 均 大 于 0.9037 ,说明 在 PIE 平 台 


(b) 随机 森林 (RF) 法 


4.5- 一 一 累计 百分比 
| ES 均 方 误差 增加 百分比 


均 方 误差 增加 百分比 /% 
N 
Co 
累计 百分比 /% 
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图 3 特征 参数 重要 性 评价 


Fig. 3 Importance evaluation of feature parameters 
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(a) 总 体 精 度 (OA) 
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(b) Kappa 系 数 
Kappa 系 数 
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9:1 0.9700 
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图 4 不 同 分 类 模型 总 体 精 度 和 Kappa 系数 的 热 图 


Fig. 4 Heat map of overall accuracy and Kappa coefficient for different classification models 


中 使 用 SVM 算法 开展 干旱 区 农作物 遥感 分 类 研究 
是 可 行 的 ,(2) 对 比 SVM- 无 红 边 和 SVM- 有 红 边 的 
结果 发 现 , 加 入 红 边 波段 后 ,农作物 的 OA F Kappa 
系数 均 有 所 上 升 ,SVM- 有 红 边 分 类 模型 的 各 样 方 分 
制 方案 OA 均 大 于 93.00% ,Kappa 系 数 均 大 于 0.9100， 
由 此 可 见 在 农作物 遥感 分 类 时 加 入 红 边 波段 可 以 
是 高 分 类 精度 。(3) 相 较 于 SVM- 有 红 边 ,SVM-RF、 
SVM-MR 和 SVM-See5.0 方 法 在 加 入 植被 指数 后 ,OA 
均值 提高 了 4.18% 、3.82% 和 3.62% , Kappa 系数 提高 
T 0.0519 .0.0473 Ail 0.0446. (4) 对 比 不 同 分 类 模型 
的 均值 发 现 ,不 同 分 类 模型 OA 和 Kappa 的 大 小 关系 
为 :SVM-RF>SVM-MR>SVM-See5.0>SVM- 有 红 边 > 
SVM- 无 红 边 ,说 明 SVM-RF 分 类 模型 的 分 类 效果 最 
好 , 相 较 于 其 他 分 类 模型 更 适合 在 焉 着 盆地 开展 农 
作物 分 类 研究 。 
2.4 分 类 结果 对 比 
选取 每 种 分 类 模型 与 样 方 分 割 方案 的 最 佳 组 
合 进 行 对 比分 析 ( 图 5)。 由 图 5 可知,5 种 最 佳 分 类 
组 合 的 OA 关系 为 :SVM-RF(8:2)>SVM-See5.0(7:3)> 
SVM-MR(5:5)>SVM- 有 红 边 (5:5)>SVM- 无 红 边 (7:3)， 
5 种 最 佳 分 类 组 合 中 分 类 效果 最 好 的 是 SVM-RF 分 
类 模型 在 样 方 分 割 为 8:2 时 取得 的 分 类 结果 ,其 OA 
和 Kappa 系 数 最 高 ,分别 是 98.72% 和 0.9866 ,表明 
SVM-RF(8:2) 分 类 组 合 与 地 面 实际 情况 具有 较 好 的 
一 致 性 ;对 比 5 种 最 佳 分 类 组 合 的 PA 和 UA 精度 发 


ae 


现 ,SVM-RF(8:2) 的 PA 和 UA 最 高 ,分 别 比 SVM-MR 


100% UA 


F1 score 


注 :PA 为 制图 精度 ;UA 为 用 户 精 度 ;Fl score W F14% 
OE 为 漏 分 误差 ;CE 为 错 分 误差 。 
图 5 5 种 最 佳 分 类 模型 评价 指标 的 雷达 图 
Fig. 5 Radar plot of evaluation indicators for the 5 best 


classification models 


(5:5) \SVM-See5.0(7:3) SVM- 有 红 边 (353) 和 SVM- 
无 红 边 (7:3) 的 PA 和 UA 高 出 0.21% 和 0.68% , 0.09% 
All 0.76% 、1.60% 和 7.21% 、4.68% 和 9.88% ,表明 
SVM-MR(5:5) 分 类 图 中 的 结果 与 地 面 真实 情况 较为 
相符 ;Fl score 的 关系 为 SVM-RF(8:2)>SVM-See5.0 
(7:3)>SVM-MR(5:5)>SVM- 有 红 边 (5:5)>SVM- 无 红 
边 (7:3) ,说 明 SVM-RF (8:2) 分 类 模型 精确 度 较 其 
他 分 类 模型 高 。OE 和 CE 的 关系 均 为 SVM- 无 红 边 
(7:3)>SVM- 有 红 边 (5:5)>SVM-MR(5:5)>SVM-See5.0 
(7:3) >SVM-RF (8:2) ,表明 SVM- 无 红 边 (7:3) 的 “ 错 
分 ”和 “ 漏 分 ”现象 较 多 ,SVM-RF(8:2) 的 “ 错 分 ”和 
“ 漏 分 ?现象 较 少 。 综 上 ,SVM-RF(8:2) 分 类 模型 的 


4 其 


分 类 结果 在 OA、Kappa 系数 、PA、UA FI score, CE 
和 OE 等 方面 表现 最 好 ,其 分 类 效果 优 于 其 他 分 类 
模型 。 

研究 借助 PIE 平 台 对 5 种 最 佳 分 类 模型 的 分 类 
结果 进行 制图 ,人 研究 区 作物 空间 分 布 如 图 6 所 示 。 
对 比 图 6c~e 可 见 ,3 种 分 类 模型 的 分 类 结果 与 当地 
SK VTE A EB Fae AR ED ARAL E 
米 小麦 和 葡萄 为 主 ,种 植 面积 分 别 约 为 1166.98 km, 
430.32 km? .344.23 km? 和 205.79 km ,分 别 约 占 研 究 
区 耕地 面积 的 43.58% 、16.07% 、12.85% 和 7.68% 。 
整体 上 , 址 着 盆地 工业 冰 椒 的 种 植 面 积 最 广 ,主要 
分 布 在 珊 普 回族 自治 县 和 博 湖 县 ;玉米 .小麦 和 葡 
萄 主要 种 植 在 和 人 硕 县 ;甜菜 主要 种 植 在 和 更 县 ,水 
称 和 果林 主要 种 植 在 博 湖 县 ;兵团 地 区 农作物 种 植 
分 布 较为 集中 ,主要 种 植 经 济 作 物 (工业 辣椒 和 工 


(a) SVM- 无 红 边 (7:3 ) 
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(b) SVM- 有 红 边 (5:5 ) 
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业 番 前 )。 综 上 ,在 普 倪 地 主要 农作物 集中 分 布 在 
土壤 肥沃 且 灌 溉 设施 较为 完善 的 地 区 ,种 植 面积 较 
大 且 在 研究 区 内 连续 分 布 ,其 他 农作物 种 植 较 少 且 
HRT EMTS o 


3 it 


本 文 借助 PIE-Engine Studio °F @ ,使 用 支持 向 
量 机 算法 ,调用 Sentinel-2 时 序数 据 , 构 建 农作物 时 
序 植被 指数 ,分割 训练 样本 和 检验 样本 ,实现 了 对 
看 着 盆地 农作物 种 植 信息 的 提取 与 评估 。PIE 平台 
免费 向 公众 开放 ,可 以 实时 调用 平台 中 存储 的 Sen- 
tinel-2 遥 感 影像 ,在 强大 的 云 计算 服务 支持 下 , 降 
低 了 遥感 数据 获取 的 门槛 和 计算 成 本 ,可 满足 不 同 
尺度 的 研究 需求 汪 。 研 究 结果 在 一 定 程 度 上 解决 
了 因 干 旱 区 生态 环境 脆弱 .种植 结构 复杂 且 地 块 破 
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图 6 5 种 分 类 模型 的 农作物 分 类 结 


Fig.6 Crop classification results for the five classification models 
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碎 、 农 作物 生长 周期 相近 及 光谱 差异 小 等 原因 产生 
的 分 类 精度 较 低 的 问题 ,为 利用 国产 云 平 台 实现 干 
旱 区 农作物 种 植 信息 的 快速 精确 提取 提供 了 新 的 
思路 和 参考 依据 。 
3.1 引入 红 边 特征 对 分 类 精度 的 影响 

从 特征 重要 性 结果 可 以 看 出 ,排名 前 十 的 特征 
参数 中 均 有 红 边 特征 参数 ,表明 红 边 特征 参数 在 农 
作物 分 类 识别 领域 具有 明显 优势 ,对 于 农作物 生长 
状态 和 健康 状况 的 判断 具有 重要 的 指导 作用 。 研 
究 中 红 边 特征 参数 的 引入 使 得 SVM- 有 红 边 分 类 模 
型 的 OA 和 Kappa 系 数 均 值 分 别 比 SVM- 无 红 边 提高 
了 0.96% 和 0.012。 因 此 ,在 特征 重要 性 分 析 中 HE 
名 前 十 的 特征 参数 中 出 现 红 边 特 征 参 数 是 合理 的 ， 
并 且 可 以 说 明 红 边 特征 参数 在 农作物 分 类 识别 中 
的 重要 性 。 黄 双 燕 等 中 和 牛 乾 坤 等 研究 表明 ,在 
农作物 遥感 分 类 中 引入 红 边 光谱 和 红 边 指数 ,使 机 
器 学 习 分 类 器 的 OA 得 到 提高 ,并 使 春 ` 冬小麦 的 识 
别 效果 得 到 明显 提升 ,表明 红 边 光谱 特征 对 分 类 精 
度 起 着 决定 性 作用 ,河套 灌区 平均 0A 达到 81% , 
Kappa 系数 达到 0.68。 综 上 , 红 边 特征 参数 可 以 帮 
助 分 类 器 更 灵敏 地 捕捉 到 不 同 农作物 特有 的 生长 
特征 和 物候 学 差异 从 而 提高 分 类 模型 的 精度 。 
3.2 引入 植被 指数 对 分 类 精度 的 影响 

人 研究 中 农作物 植被 指数 的 引入 使 得 SVM- 
See5.0 .SVM-RF 和 SVM-MR 分 类 模型 的 OA 均值 比 
SVM- 有 红 边 分 别提 高 了 3.62% .4.18% 和 3.82% ,Kap- 
pa 系数 均值 分 别提 高 了 0.0446 .0.0519 和 0.0473 ,说 
明 植 被 指数 在 农作物 分 类 中 具有 有 效 性 和 重要 性 ， 
能 够 捕捉 到 农作物 的 生长 特征 并 帮助 区 分 不 同 农 
作物 的 类 别 。 姜 伊 兰 等 1 研究 指出 利用 NDVI 时 序 
差异 指数 提取 的 农作物 OA 和 Kappa 系数 比 最 大 似 
然 法 和 支持 向 量 机 法 分 别提 高 10.02% 、0.21 和 
4.18% 和 0.09; 谷 祥 辉 等 后 研 究 表明 时 间 序 列 组 合 
植被 指数 用 于 农作物 分 类 是 可 行 的 ,分 类 模型 的 精 
度 和 Kappa 系数 分 别 达 到 88.52% 和 0.8650; 综 上 ,多 
种 植被 指数 结合 时 间 序 列 信息 可 以 从 生长 时 期 和 
生长 状态 上 区 分 农作物 ,从 而 提高 农作物 识别 的 准 
确 性 。 

研究 使 用 了 3 种 特征 优选 方法 获得 特征 参数 的 
重要 性 排序 ,排名 前 十 的 特征 参数 均 仿 有 红 边 波段 
或 红 边 指数 ,表明 红 边 波段 和 红 边 指数 在 农作物 分 
类 中 发 挥 着 重要 作用 。 因 此 ,在 后 续 人 研究 中 将 考虑 


更 多 与 红 边 波段 有 关 的 植被 指数 ,选取 其 中 重要 性 
较 高 的 植被 指数 ,提高 作物 分 类 精度 。 人 研究 也 存 有 
不 足 , 作 物 分 类 结果 中 部 分 农田 存在 “ 错 分 "和 “ 漏 
分 "现象 ,后 续 需 通 过 人 工 干预 和 增加 分 类 特征 来 
减少 “ 错 分 "和 “ 漏 分 "现象 的 发 生 ; 男 外 ,本 次 研究 
影像 数据 较为 单一 ,后 续 考 虑 将 Sentinel-2 影 像 与 
其 他 遥感 影像 进行 融合 “” ,充分 挖掘 地 物 的 光谱 
寺 征 纹理 特征 和 物候 特征 ,进一步 提高 农作物 识 
别 精度 。 


4 结论 


(1) 使 用 PE 平台 可 快速 地 访问 海量 遥感 图 像 
及 其 他 数据 资源 , 因 其 高 性 能 的 云 计算 能 力 可 快速 
完成 覆盖 看 普 贫 地 影像 数据 的 去 云 裁剪 及 植被 指 
数 构 建 等 处 理 。 基 于 多 时 间 序 列 影 像 源 与 PIE 相 结 
合 可 方便 快捷 地 进行 作物 种 植 信息 提取 , 较 本 地 处 
理 具 有 明显 优势 。 

(2) 25 种 分 类 模型 的 OA Fl Kappa 系数 均 在 

92.20% 和 0.9037 以 上 ,其 中 SVM-RF 方 法 在 样 方 分 
割 为 8:2 时 ,OA 和 Kappa 系 数 最 高 ,分别 为 98.72% 
和 0.9866, 说 明 在 PIE 中 使 用 SVM 算法 提取 作物 信 
息 是 可 行 的 。 
(3) 5 种 SVM 算法 分 类 组 合 的 OA 均值 关系 为 
SVM-RF (97.95% )>SVM-MR (97.59% ) >SVM-See5.0 
(97.39% ) >SVM- 有 红 边 (93.77% ) >SVM- 无 红 边 
(92.81%) ,Kappa 系 数 均值 关系 为 SVM-RF(0.9755 ) > 
SVM-MR (0.9709)>SVM-See5.0(0.9682)>SVM- 有 红 
边 (0.9236)>SVM- 无 红 边 (0.9116) ,其 中 SVM-RF、 
SVM-See5.0 和 SVM-MR 方 法 中 加 入 了 红 边 波段 和 
植被 指数 ,提高 了 作物 识别 的 精度 。 

(4) 焉 普 例 地 农作物 以 辣椒 、 玉 米 小麦 和 葡萄 
为 主 , 种 植 面积 分 别 约 为 1166.98 km’ 430.32 km’, 
344.23 km2 和 205.79 km? ,分 别 约 占 研究 区 耕地 面积 
HJ 43.58% 16.07% 、12.85% 和 7.68%, 集 中 分 布 在 土 
壤 肥 沃 且 灌溉 设施 较为 完善 的 地 区 ,种植 面积 较 大 
且 在 研究 区 内 连续 分 布 ,其 他 农作物 种 植 较 少 , 呈 
SRSA o 
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Remote sensing identification and assessment of crops in the Yangqi Basin, 
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Abstract: To obtain timely and accurate information about crop cultivation in arid zones, this study used the PIE- 
Engine Studio platform to extract 14 vegetation indices in the Yanqi Basin, Xinjiang, China based on 2022 Senti- 
nel-2 images and 1948 field location sampling data during the crop reproduction period. Crop planting informa- 
tion was extracted using the See5.0 decision tree, random forest (RF), and multiple regression (MR) models to se- 
lect feature parameters. Each model was combined with support vector machine (SVM) algorithms to construct 
five classification models and five sample segmentation schemes. The best classification scheme was determined 
by visual interpretation and confusion matrix comparison. The results are as follows: (1) The overall accuracy 
(OA) and Kappa coefficients of all classification models are above 92.20% and 0.9037, respectively, indicating 
that it is feasible to extract crop information using the SVM algorithm in the PIE platform. (2) The mean OA and 
Kappa coefficients of SVM-with-red-edge are 93.77% and 0.9236, which are 0.96% and 0.0120, respectively. (3) 
The introduction of vegetation index improved the OA and Kappa coefficients of SVM-RF, SVM-MR, and SVM- 
See5.0 compared with the SVM-with-red-edge method. (4) The mean OA and Kappa coefficient relationships for 
the five classification models were SVM-RF>SVM-MR>SVM-See5.0>SVM-with-red-edge>S VM- without-red- 
edge, showing that the inclusion of the red-edge band and vegetation index significantly improved the accuracy 
of crop identification, with SVM-RF (8:2) being the best classification model with OA and Kappa coefficients of 
98.72% and 0.9866, respectively. These results provide new ideas and references for accurate and rapid access to 
large-scale arid zone crop information. 


Key words: crop; Sentinel-2; support vector machines; PIE-Engine Studio; Yanqi Basin 


